بهبود الگوریتم های طبقه بندی مجموعه داده های نامتوازن با استفاده از روش های فازی و الگوریتم های تکاملی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده برق و کامپیوتر
- نویسنده محبوبه مهدی زاده
- استاد راهنما مهدی افتخاری
- سال انتشار 1392
چکیده
طبقه بندی عملی مهم در داده کاوی و کشف دانش از پایگاه داده است. در اغلب موارد، زمانی که تلاش می کنیم تا یک طبقه بند را از داده های آموزشی یاد بگیریم، داده های آموزشی توزیع کلاس نامتوازنی دارند. مسألهی طبقهبندی نامتوازنِ باینری بدین صورت تعریف می شود: یک مسأله ی طبقهبندی است که در آن تفاوت قابل توجهی میان میزان نمونههای دو کلاس وجود دارد. اغلب الگوریتم های یادگیری ماشین فرض می کنند که تعداد نمونه های آموزشی در کلاس های متفاوت برابر می باشند و براین اساس، یک طبقه بند را یاد می گیرند؛ بنابراین زمانی که این الگوریتم ها را به داده های نامتوازن اعمال می کنیم، طبقه بند یادگرفته شده غالباً از کلاس اکثریت منتج می شود که این موضوع به پیش بینی بسیار ضعیف از کلاس اقلیت منجر می شود زیرا آموزش کلاس اقلیت به درستی انجام نشده است. بنابراین، کنترل و حل مسأله داده ی نامتوازن برای بهبود کارایی امری ضروری است. روش های بسیاری برای مسأله یادگیری نامتوازن پیشنهاد شده است که به دو دسته ی اصلی تقسیم می شوند: نمونه گیری از داده و اصلاح الگوریتم های موجود. در این کار تحقیقاتی، از تئوری فازی و الگوریتم های تکاملی استفاده می کنیم و با استفاده از این تکنیک ها، پنج الگوریتم برای مواجهه با مسائل نامتوازن پیشنهاد می دهیم. از میان روش های ارائه شده، روش های اول تا چهارم سعی در بهبود سیستم های طبقه بندی مبتنی برقوانین فازی دارند تا این طبقه بندها با مسائل نامتوازن سازگار شوند و روش پیشنهادی پنجم با استفاده از نمونه گیری از داده ها سبب متوازن شدن مجموعه داده می شود. نتایج حاصل از اعمال این روش ها نشان دهنده ی برتری آن ها نسبت به روش هایی است که اخیراً در این حوزه ارائه شده اند. همچنین با مقایسه ی روش های پیشنهادی با یکدیگر در می یابیم که روش پیشنهادی دوم (که روشی حساس به هزینه می باشد و از تئوری فازی و دو الگوریتم تکاملی استفاده می کند) عملکرد بهتری نسبت به سایر روش های پیشنهادی دارد.
منابع مشابه
طراحی فیلترهای توری پراشی با استفاده از الگوریتم های تکاملی
چکیده: فیلترهای توری پراشی نوع جدیدی از فیلترهای نوری هستند که بر مبنای تشدیدی مود هدایتشده هستند و دارای کاربردهای روزافزونی در آشکارسازها، پردازشگرهای نوری، تزویجکنندهها و غیره هستند. هدف از طراحی این فیلترها انتخاب مناسب پارامترهای هندسی است. با انتخاب دقیق این پارامترها، فیلترهایی با بازدهی بالا در یک فرکانس رزونانس طراحی میشوند. طراحی این فیلترها با ویژگیهای طیفی دقیق موضوعی جالب و در...
متن کاملطبقه بندی تراکم توده های جنگلی با استفاده از تصویر ماهوارۀ IRS و الگوریتم ناپارامتریک kNN
برآوردهای کمّی و دقیق از مشخصههای تودههای جنگلی لازمه مدیریت صحیح آنها است. تصاویر سنجش از دور با توجه به اطلاعات مکانی دقیق و وسیع، همواره ابزاری مقرون به صرفه در مدیریت جنگل است و یکی از متداولترین کاربردهای تصاویر در علم جنگلداری، طبقهبندی مشخصههای تودههای جنگلی و تهیۀ نقشههای موضوعی آنها است. هدف این پژوهش بهینهسازی طبقهبندی تراکم (تعداد درختان در هکتار) در تودههای جنگلی با استفاده...
متن کاملطبقه بندی سنگ های ساختمانی از دیدگاه قابلیت برش با استفاده از روش خوشه بندی فازی
پیش بینی قابلیت برش سنگ به عنوان یکی از فاکتورهای موثر در تخمین هزینهها و پیش بینی میزان تولید یک کارخانه فرآوری سنگ از اهمیت بالایی برخوردار میباشد. بنابراین شناخت کامل سنگهای ساختمانی و ارزیابی توان اجرایی دستگاههای برش در کارخانههای فرآوری، طراحان و برنامهریزان تولید را به سمت بهبود سرعت فرآوری و افزایش تولید سوق میدهد. از اینرو، به کارگیری روشهای نو و کاربردی برای دستیابی به این اه...
متن کاملمقایسه ی الگوریتم های مختلف طبقه بندی داده ها برای تعیین نوع زردی در نوزادان
Background and Aim: Neonatal jaundice is a matter that is very important for clinicians all over the world because this disease is one of the most common cases that requires clinical care. The aim of this study is to use data classification algorithms to predict the type of jaundice in neonates, and therefore, to prevent irreparable damages in future. Materials and Methods: This is a descripti...
متن کاملانتخاب ژن و طبقه بندی سلول های سرطانی بر پایه داده های ریزآرایه با استفاده از الگوریتم ترکیبی BPSO و BLDA
داده های ریزآرایه در تشخیص و طبقه بندی انواع بافت های سرطانی نقش بسزایی دارند. در پژوهش های سرطان همیشه تعداد نسبتا کم نمونه ها در ریزآرایه باعث ایجاد مشکلاتی در طراحی طبقه بندها شده است. بنابراین داده های ریزآرایه قبل از طبقه بندی از طریق تکنیک های انتخاب ژن پیش پردازش و ژن های فاقد اطلاعات آن ها دور ریخته می شود. اساسا یک روش انتخاب ژن مناسب می تواند بطور موثر کارایی دسته بندی بیماری ها (سرطا...
متن کاملبهبود کلاس بندی داده های نامتوازن با استفاده از الگوریتم های یادگیری ماشین
در دنیای امروز مسئله کلاس بندی داده های نا متوازن از اهمیت خاصی برخوردار است . کلاس بندی این داده ها به گونه ای است که ، کلاسی که از نظر دامنه کاربرد اهمیت زیادی دارد (کلاس اقلیت ) شامل تعداد حالات کمتری نسبت به کلاسی است که از اهمیت خاصی برخوردار نیست (کلاس اکثریت). به این مجموعه داده ها داده های نامتوازن می گویند. روش های مختلفی برای کلاس بندی این نوع داده ها ارائه شده است .در کلاس بندی این د...
منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023